cni 半 党 谷 作 池 玉 


第 64 卷 第 6 期 2020 年 3 月 


专利 文献 技术 要 素 识别 方法 研究 


以 纳米 肥料 领域 为 例 


目 李 晓 曼 。 张 学 福 。 宋 红 燕 ” 孙 详 
中 国 农业 科学 院 农业 信息 研究 所 ”北京 100081 


摘 要 : [目的 /意义 ] 专 利 是 技术 情报 最 可 靠 的 来 源 之 一 ,专利 分 析 可 以 实现 专利 信息 的 挖 握 和 利用 ,辅助 专利 技术 创新 。 
技术 演化 分 析 是 指 技术 主题 产生 、 发 展 、 转 移 和 变化 乃至 漂 灭 的 过 程 ,如 何 对 专利 技术 信息 进行 深度 揭示 是 当前 
专利 技术 演化 分 析 的 研究 重点 ,其 关键 在 于 技术 要 素 信息 的 揭示 。[ 方 法 /过 程 ] 通 过 典型 专利 剖析 、 特 征 识别 构 
建 技术 要 素 识别 框架 ,提出 面向 特定 领域 的 基于 专利 文献 的 技术 要 素 识别 方法 。| 结果 /结论 ] 将 提出 的 技术 要 素 
识别 方法 应 用 于 纳米 肥料 领域 ,通过 典型 专利 剖析 确定 5 种 技术 要 素 :材料 、 产 品 、 方 法 \ 功 效 和 用 途 , 并 基于 SAO 结 


词 : 技术 演化 ”技术 要 素 SAO 结构 
: G255. 53 


构 及 领域 词 表 完成 技术 要 素 的 识别 。 该 方法 能 为 技术 演化 分 析 黄 定 基 础 ,能 够 从 多 角度 展示 领域 技术 信息 。 
纳米 肥料 技术 网 络 


国 蚤 的 


一 因此 ,它们 被 用 作 分 析 技 术 发 展 的 重要 工具 中。 专 


在 埠 作 者 ”等 。 计 算 机 语言 学 和 文本 挖 损 技 术 的 发 
民生 得 专利 分 析 能 够 分 析 专 利文 献 的 文本 内 容 , 显 著 
扩 届 了 专利 分 析 的 范围 ,受到 了 相当 大 的 关注 。 


通过 对 专利 文献 的 文本 内 容 进行 深度 挖 据 可 以 梳理 技 
术 的 发 展 脉络 ,能 够 为 技术 人 员 探 究 、 回 溯 技 术 起 源 和 
发 展 提供 可 靠 的 帮助 ,并 对 确定 科技 优先 领域 .合理 配 
置 科技 资源 具有 重要 的 意义 ” 。 

技术 演化 分 析 是 指 技术 主题 产生 发展 .突破 创 
新 转移 和 变化 妃 至 潭 灭 的 过 程 , 是 专利 技术 挖掘 的 重 
要 内 容 ””。 当 前 技术 演化 分 析 的 相关 文献 “对 技 
术 的 研究 仅 局 限 在 技术 主题 上 ,对 技术 拆 分 重组 的 重 
视 不 足 ,使 研究 者 难以 在 更 具体 、 细 化 的 层次 上 对 技术 


演化 的 特征 规律 展开 研究 。 在 文本 分 析 的 范畴 中 , 通 
过 测量 文档 之 间 的 关键 词 的 共 现 关系 来 识别 研究 领域 
的 技术 主题 是 进行 技术 演化 分 析 的 基础 方法 "1。 
Y. G. Kim 等 研究 了 基于 关键 词 向 量 的 专利 聚 类 方法 ， 
用 于 新 兴 技 术 的 预测 所 。 随 着 语义 分 析 技 术 不 断 发 
展 ,J. Yoon 等 "| 基于 SAO 结构 描述 专利 相似 性 的 能 
力 ,通过 构建 专利 语义 网 络 来 识别 技术 发 展 趋势 。 汪 
雪 锋 等 利用 SAO 结构 信息 挖掘 专利 文本 中 的 技术 
言 息 来 构建 技术 路 线 图 ;Z，Hu 等 ”构建 了 三 层 分 析 
单元 (SAO 基础 语义 单元 .技术 主题 .技术 范畴 ) ,通过 
统计 主题 在 聚 类 篮 的 分 布 来 绘制 技术 演化 图 。 

当代 技术 日 新 月 异 , 不 同 领 域 逐步 出 现 交 又 融合 ， 
为 了 更 清晰 地 刻画 技术 演化 过 程 ,需要 对 技术 进行 细 
粒度 的 分 析 。 技 术 通 常 是 以 系统 形式 存在 的 , 技 
术 要 素 是 指 在 技术 演化 分 析 的 过 程 中 涉及 的 技术 不 同 
分 析 维 度 ,是 构成 技术 系统 并 维持 其 发 展演 化 的 最 小 
单元 “ 。 从 技术 系统 的 角度 理解 技术 演化 ,其 内 容 包 
含 技术 系统 内 部 技术 各 要 素 自 身 的 变化 或 发 展 及 各 技 
术 要 素 之 间 的 相互 作用 和 共同 发 展 ”。 借 鉴 TIRZ 2 
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技术 进化 路 线 的 思想 ,基于 技术 演化 分 析 进 行 技 术 预 
测 的 基础 是 获取 不 同 技术 要 素 的 技术 演化 路 径 , 技 术 
演化 路 径 的 基础 是 技术 要 素 及 其 关联 关系 ,形成 技术 
预测 一 技术 演化 一 技术 要 素 的 依存 关系 。 因 此 ,识别 
技术 要 素 及 其 技术 要 素 之 间 的 关联 关系 是 细 粒 度 地 揭 
示 相 关 技 术 演 化 情况 的 关键 步骤 ,也 可 为 未 来 技术 预 
测 英 定 坚 实 基 础 。 

本 文 面向 技术 演化 分 析 的 需求 ,以 专利 文献 为 分 
析 对 象 ,通过 典型 专利 剖析 初步 确定 领域 技术 要 素 及 
其 特征 ,然后 设计 特征 识别 方法 来 自动 识别 技术 要 素 
的 特征 ,并 构建 基于 特征 的 技术 要 素 识别 框架 。 最 后 ， 
以 纳米 肥料 领域 为 研究 对 象 ,应 用 技术 要 素 识 别 框架 
完成 了 技术 要 素 的 识别 ,并 对 框架 进行 了 补充 和 完善 。 


2 二 相关 研究 工作 


人 工 (技术 ) 谷 善 其 事 , 必 先 利 其 器 (技术 要 素 ) 中 。 
疗 - 解 决 技术 细 粒 度 的 问题 ,相关 研究 者 尝试 对 技术 信 
息 朝 行 分 类 ,界定 了 不 同 的 分 析 维度 。 安 观 层面 的 技术 
岩 束 需要 通过 一 定 的 知识 提炼 、 归 纳 才能 得 到 ,无 法 从 
后 专 利文 本 中 直接 获取 。 基 于 问题 - 解决 方案 类 型 
技术 分 析 主 要 依据 TRIZ 理论 ,其 核心 内 容 之 一 是 矛 
盾 本 创新 原理 ,矛盾 是 指 发 明 中 待 解决 的 各 种 问题 ， 
这 些 矛 盾 冲突 的 创新 原理 即 解决 方案 。 将 专利 

信息 表示 成 技术 问题 信息 和 技术 解决 方案 信息 ,从 
确 胡 下 一 步 的 分 析 。 胡 正 银 等 吕 基 于 5W1H 模型 将 
“What" 表示 专 利文 献 的 技术 问题 (Problem ) 信息 ， 
“1 也” 表示 解决 技术 问题 的 技术 方案 (Solution ) 信息 ， 
“WB” 表示 专利 的 实现 技术 功能 (Function) 与 达成 的 技 
术 效 果 ( Effect) 信 息 。 付 芸 等 ”以 技术 问题 和 技术 方案 


为 分 析 维 度 ,六 选 创新 解决 方案 。H.B，Kim 等 ”探讨 
了 如 何 利用 技术 问题 和 技术 方案 来 实现 技术 重用 。 

微观 层面 的 技术 信息 来 源 于 专利 元 数据 字段 ,可 
以 从 专利 文本 中 直接 获取 。S.， Choi 等 ”在 构建 技术 
树 时 设置 了 产品 .技术 和 功能 3 个 维度 ;S，Choi 等 
在 进行 技术 路 线 图 绘制 时 对 技术 做 了 进一步 的 划分 ， 
设置 了 产品 ,技术 、 材 料 、 技 术 属 性 和 功能 维度 。 翟 东 
升 等 “通过 对 产品 功能 ,科学 效应 与 功效 等 多 维度 
的 层级 关系 进行 分 析 , 构 建 技术 树 ;X，Wang 等 在 
进行 技术 发 展 趋势 识别 分 析 时 ,划分 了 材料 .技术 、 影 
响 因 素 组件、 产品 、 目 标 和 未 来 方向 7 个 维度 ; 汪 雪 锋 
等 3 构建 了 6 层 技术 路 线 图 (材料 .技术 .产品 .目标 、 
应 用 和 影响 因素 ) ; 李 倩 "在 进行 专利 新 兴 技 术 识 别 
研究 时 ,将 短语 类 型 动 宾 组 合 及 宾 补 组 合 的 结构 分 为 
产品 方法、 科学 效应 和 技术 属性 ; 郭 俊 芳 等 ”在 进行 
技术 形态 识别 研究 时 ,将 技术 领域 关键 词 分 为 技术 属 
性 产品 部 件 ,部件 材料 ,技术 性 能 4 个 类 别 。 

通过 文献 调研 ,可 以 发 现 ,宏观 层面 上 ,技术 的 分 
析 维 度 可 以 分 为 :技术 问题 和 技术 方案 等 。 宏 观 层 再 
的 技术 信息 是 经 过 后 期 分 析 总 结 得 到 的 主题 信息 , 单 
个 的 词 或 词组 并 不 能 表示 其 相关 信息 ;微观 层面 上 , 技 
术 的 分 析 维 度 可 以 分 为 :技术 、 产 品 . 方 法 、 材 料 、 组 件 / 
部 件 功能、 科学 效应 ,技术 属性 ,技术 性 能 、 应 用 领域 、 
影响 因素 。 微 观 层面 的 技术 信息 大 多 对 应 专利 文本 中 
的 某 个 具体 的 技术 短语 或 词组 。 其 中 ,技术 的 主体 信 
息 包括 5 种 技术 要 素 ,分 别 为 :技术 .产品 方法、 材料、 
组 件 / 部 件 ;技术 的 效果 信息 包括 6 种 技术 要 素 , 分 别 
为 :功能 .科学 效应 .技术 属性 ,技术 性 能 .应 用 领域 . 影 
响 因素 。 具 体 技术 要 素 的 解释 如 表 1 所 示 。 


表 1 技术 要 素 列 表 及 含义 信息 


分 析 粒度 技术 要 素 解释 
宏观 层面 。 ”技术 问题 /研究 问题 。 是 指 在 当前 技术 领域 存在 的 \ 技 术 发 展 过 程 中 存在 的 问题 [30 -32] 
技术 方案 /研究 方案 指 在 某 -一 领域 内 ,为 了 解决 某 一 关键 问题 所 提出 的 具体 技术 方案 [30 -32] 
微观 层 而 技术 产品 设计 制造 和 测试 所 需 的 技术 ,包括 所 有 相关 的 过 程 .制造 过 程 或 方法 ,22.3 35] 
产品 目标 领域 内 的 具体 产品 ,是 指 可 以 从 市 场 中 获得 并 且 技 术 活动 所 需 的 各 种 东西 ,包括 有 形 的 物品 、 无 形 的 服务 
等 [11, 22, 33 -36] 
方法 方法 是 人 们 在 技术 实践 中 所 利用 的 各 种 方法 ,程序 .规则 .技巧 的 总 称 。 它 帮助 人 们 解决 “做 什么 " “怎么 做 "以 及 
“怎样 做 得 更 好 "的 问题 
材料 某 一 技术 方案 所 使 用 的 关键 材料 11 2,35] 
组 件 /部 件 歧 术 或 产品 的 分 支 主题 535] 
功能 歧 术 和 产品 所 发 挥 的 有 利 作用 、 效 能 34] 
科学 效应 包含 技术 实现 和 产品 功能 实现 过 程 中 所 用 的 科学 原理 ,系统 属性 .现象 与 其 工程 应 用 等 ,其 中 效应 指 由 某 种 动因 或 
原因 所 产生 的 一 种 特定 的 科学 现象 36] 
技术 属性 测度 技术 发 展 成 果 的 指标 ,通常 与 措 述 变化 程度 的 动词 连用 [36] 
技术 性 能 衡量 技术 本 身 的 特性 [37 
应 用 领域 站 目标 领域 产品 可 以 应 用 的 具体 领域 2] 


影响 因素 


法 术 领 域 发 展 面临 的 关键 问题 ,该 层次 的 问题 可 以 被 “技术 层次 中 的 技术 方案 所 解决 2] 


60 


李 晓 曼 , 张 学 福 , 宋 红 燕 ， 等. 专利 文献 技术 要 素 识别 方法 研究 


(O59 =68. 


ChinaX iv 会 作 1 
以 纳米 肥料 领域 为 全 [7] (全 中 iY 舍 作 期 芽 


总 体 来 说 ,针对 特定 的 技术 领域 ,不 同 研究 者 根据 
分 析 的 需要 以 及 分 析 方 法 设置 了 不 同 的 分 析 维 度 ,对 
于 技术 要 素 的 确定 主要 依靠 分 析 者 的 经 验 选 择 ,缺乏 
客观 信息 的 支持 。 另 外 ,对 于 技术 要 素 的 识别 , 仅 提出 
了 要 素 的 特征 标注 方法 如 词性 以 及 线索 词 等 特征 ,并 
未 形成 规范 化 的 流程 设计 方案 ,准确 性 和 可 操作 性 无 
法 保证 。 


3 ”基于 专利 文献 的 技术 要 素 识别 


基于 文献 调研 的 技术 要 素 为 分 析 提供 思路 ,可 以 
作为 技术 要 素 识别 的 基础 。 技 术 要 素 的 识别 主要 包括 
两 部 分 内 容 :一 是 确定 领域 包含 哪些 技术 要 素 , 二 是 如 
何 识别 技术 要 素 对 应 的 关键 词 ,并 判断 选 定 的 技术 要 
莫 是 否 可 以 覆盖 领域 关键 词 集 , 即 满足 每 一 种 技术 要 
素 都 有 其 对 应 的 领域 关键 词 以 及 每 一 个 领域 关键 词 都 
可 划分 为 某 一 种 技术 要 素 。 基 于 领域 专利 文献 数据 的 
CR 要 来 识别 方法 主要 分 为 3 个 步 又 : 
与 (1 ) 典型 专利 前 析 。 选 取 特 定 研究 领域 的 小 样本 
晤 睫 型 专利 进行 分 析 , 剖 析 专 利文 本 内 容 , 挖 掘 领域 所 
后 的 技术 要 素 。 解 析 技 术 要 素 的 特征 信息 如 位 置 、 
本 这 等 ,标记 技术 要 素 的 特征 信息 。 
@(2 ) 特征 识别 。 选 取 合适 的 方法 识别 特征 信息 ， 
六 这 动 化 识别 技术 要 素 商定 基础 。 
.全 (3 ) 基 于 特征 的 技术 要 素 识别 框架 。 选 取 大 样本 
谢 数 据 进 行 实验 , 即 判断 每 一 种 技术 要 素 都 有 其 对 
应 胸 领 域 关键 词 以 及 每 一 个 领域 关键 词 都 可 划分 为 基 
一 夭 技 术 要 素 。 如 果 否 , 则 有 两 种 情况 ,一 是 出 现 了 在 
撒 情 数据 中 未 包含 的 技术 要 素 ,总 结 其 特征 信息 ,返回 
步骤 (2) ;二 是 由 于 步骤 (1) 特征 选取 的 不 够 导致 技术 
要 素 未 识别 全 , 则 需 补充 该 技术 要 素 的 特征 信息 。 该 
方法 是 一 个 动态 的 要 素 识别 的 过 程 ,可 以 适应 不 同 的 
学 科 领 域 。 

基于 领域 专利 文献 数据 的 技术 要 素 识别 框架 见 
图 1。 
3.1 典型 专利 剖析 
3.1.1 基于 技术 要 素 的 专利 知识 表示 

专利 文献 是 专利 知识 的 载体 ,专利 技术 方案 是 为 
了 满足 设计 目的 而 采取 的 技术 特征 集合 ,可 形式 化 
为 PS = (SC, SR) ,其 中 SC 为 技术 要 素 ,SR 为 技术 要 
素 的 关联 关系 ,如 图 2 所 示 。 从 技术 演化 分 析 的 目的 
出 发 ,结合 专利 标题 ,摘要 内 容 的 具体 表达 结构 进行 特 
征 选 择 , 通 过 挖 气 技 术 要 素 及 其 之 间 的 关联 关系 ,从 而 
阐述 发 明 的 原理 和 发 明 的 信息 。 因 此 ,本 节 将 专利 着 
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图 1 基于 领域 专利 文献 数据 的 技术 要 素 识别 框架 


析 成 技术 要 素 信息 ,并 对 其 特征 进行 总 结 。 
专利 技术 方案 


图 2 专利 技术 方案 表示 模型 


3.1.2 领域 专利 剖析 

以 纳米 肥料 领域 为 例 ,在 本 节 阐 述 领域 专利 剖析 
的 内 容 。 选 取 了 纳米 肥料 领域 10 件 专利 作为 典型 专 
利 进 行 剖 析 , 提 取 领 域 关 键 词 ,总 结 关 键 词 的 含义 ,分 
为 五 大 类 。 该 领域 涉及 的 技术 要 素 有 :产品 .材料 、 方 
法 .功效 和 应 用 领域 。 各 技术 要 素 的 含义 及 其 特征 信 
息 见 表 2。 

(1) 对 于 产品 技术 要 素 , 其 位 置信 息 没有 明显 特 
征 , 可 出 现在 新 活性 摘要 NO ,用途 摘要 USE 和 创新 性 
摘要 AD ;对 于 其 句法 信息 ,经常 出 现在 主语 位 置 ,但 也 
可 出 现在 宾语 位 置 ;其 相关 的 动词 也 没有 具体 的 特征 ， 
各 种 类 型 动词 均 有 涉及 ;对 于 其 语义 信息 ,产品 技术 要 
素 语 义 上 是 以 "fertilizer 为 中 心 词 的 短语 。 因 此 ,利用 
语义 信息 可 以 识别 产品 技术 要 素 相 关 的 关键 词 。 

(2) 对 于 材料 技术 要 素 , 其 位 置信 息 没 有 明显 特 
征 ,可 出 现在 NO USE 、 AD; 对 于 其 句法 信息 ,经常 出 现 
在 宾语 位 置 ;其 相关 的 动词 主要 为 包含 类 动词 如 com- 
prise 且 处 于 NO 位 置 ,表示 产品 关键 词 的 成 分 信息 ;对 
于 其 语义 信息 ,材料 技术 要 素 语 义 上 是 以 “material” 
“peel “oxide “acid ”为 中 心 词 的 短语 。 因 此 ,利用 位 
置信 息 、 句 法 信息 动词 信息 和 语义 信息 可 以 识别 材料 
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技术 要 素 相关 的 关键 词 。 

(3 ) 对 于 方法 技术 要 素 ,其 位 置信 息 没 有 明显 特 
征 , 可 出 现在 NO USE AD ;对 于 其 句法 信息 ,经 常 出 现 
在 主语 位 置 ,但 也 可 出 现在 宾语 位 置 ; 其 相关 的 动词 也 
没有 具体 的 特征 ,各 种 类 型 动词 均 有 涉及 ,如 作为 方法 
关键 词 与 包含 类 动词 的 宾语 常 为 步骤 类 短语 ;对 于 其 
语义 信息 ,方法 技术 要 素 语 义 上 是 以 “method "为 中 心 
词 的 短语 或 为 动 名 词 与 材料 相 结合 的 步骤 类 短语 。 
此 ,利用 位 置信 息 、 句 法 信息 动词 信息 和 语义 信息 可 
以 识别 方法 技术 要 素 相关 的 关键 词 。 

(4) 对 于 功效 技术 要 素 , 其 位 置信 息 仅 出 现在 
NO AD; 对 于 其 句法 信息 , 仅 出 现在 宾语 位 置 ; 对 于 其 
相关 的 动词 ,作为 improve .decrease 等 描述 变化 动词 的 


宾语 ,或 作为 comprise 等 包含 类 动词 的 宾语 处 于 AD 位 
置 ;对 于 其 语义 信息 ,语义 上 是 以 “cost”“ efficiency” 
“safe”“taste”“ speed” 为 中 心 词 的 短语 。 因 此 ,利用 位 
置信 息 、 句 法 信息 和 动词 信息 可 以 识别 功效 技术 要 素 
相关 的 关键 词 。 

(5) 对 于 应 用 领域 技术 要 素 , 其 位 置信 息 仅 出 现 
在 USE; 对 于 其 句法 信息 , 仅 出 现在 宾语 位 置 ;对 于 其 
相关 的 动词 ,作为 be useful for、be suitable for、used for 
等 动词 的 宾语 ;对 于 其 语义 信息 ,语义 上 是 以 “plant- 
ing "为 修饰 语 且 与 作物 种 类 搭配 的 短语 。 因 此 ,利用 
位 置信 息 、 句 法 信息 和 动词 信息 可 以 识别 应 用 领域 技 
术 要 素 相关 的 关键 词 。 


表 2， 典 型 专利 技术 要 素 的 定义 及 特征 信息 


要素 定义 


特征 信息 示例 词 


在 目标 领域 内 的 具体 产品 , 即 纳米 肥料 领域 


出 现在 NO USE AD; 经 常 出 现在 主语 位 置 ; 各 种 类 型 的 
的 具体 产品 动词 均 有 涉及 ;语义 上 是 以 “fertilizer” 为 中 心 词 的 短语 
0 USE、AD ;经 常 出 现在 宾语 位 置 ; 常 作为 com- 


bio organic fertilizer nano modi- 


fied calcium fertilizer 


pig manure 、microbial residue 、 


长 动词 的 宾语 ;语义 上 是 以 “material ”“peel” 


trace element 


人 材料 是 指 利用 某 种 技术 制作 产品 时 所 使 用 的 关键 。 出 现在 
© 材料 , 即 制作 纳米 肥料 相关 产品 所 使 用 的 关 “prise 等 包含 
键 材料 “oxide “acid "为 中 心 词 的 短语 


法 方法 是 人 们 在 技术 实践 中 所 利用 的 各 种 方 


现在 


i 


料 制作 中 的 关键 步骤 以 及 各 种 制备 方法 
是 指 产品 或 材料 的 具体 功能 , 即 纳米 肥料 领 出 现在 


.5 玉音 领 域 。。 是 指 目标 领域 产品 具有 的 具体 用 途 及 应 用 领 ”出 现在 USE; 
>< 域 ,纳米 肥料 领域 的 应 用 领域 包括 施用 植物 
. 和 


OUSE、 
法 ,程序 规则 、 技 巧 的 总 称 。 包 括 在 纳米 肥 4 的 动词 均 有 涉及 ;语义 上 是 以 “method "为 中 心 词 的 短语 
或 为 动词 和 材料 组 合 的 形式 

0、AD; 经 常 出 现在 宾语 位 置 ;作为 improve de- 
GN 域 中 促进 植物 生长 防虫. 防 病 ,提高 作物 产 。 eease 等 描述 变化 动词 的 宾语 ;语义 上 以 “eost” “efficien- 

cy”“safe”“taste”“speed” 为 中 心 词 的 短语 

经 常 出 现在 宾语 位 置 ;作为 be useful for、be 
suitable for .used for 等 动词 的 宾语 ;语义 上 是 以 “planting” 


AD; 主 语 和 宾语 位 置 均 会 出 现 ;各 种 类 


preparing compound fertilizer、 


mixing strontium powder 


efficiency 、heavy metal 、growth 、 


good stability 


leafy vegetable ,com underground 


tuber crop 


a 种 类 和 施用 位 置 两 类 为 修饰 语 且 与 作物 种 类 搭配 的 短语 


3, 纪 特征 识别 
3 技术 要 素 特征 信息 

将 非 结构 化 的 以 文本 形式 存在 的 专利 信息 转化 为 
由 一 系列 文本 特征 表示 的 数据 集合 ,用 以 描述 和 替代 
自由 文本 并 指导 自动 化 识别 要 素 信息 。 对 于 典型 专利 
剖析 确定 的 技术 要 素 ,通过 分 析 各 要 素 包 含 的 特征 信 
息 ,将 技术 要 素 的 特征 总 结 为 以 下 4 个 ,具体 为 

特征 1: 位 置 特征 。 对 于 德 温 特 数据 库 中 的 专利 
信息 ,摘要 是 经 过 专家 改写 的 结构 化 文本 ,不 同 部 分 的 
摘要 表征 不 同 的 含义 。 如 :应 用 领域 常 出 现在 用 途 摘 
要 中 ,功效 常 出 现在 创新 性 摘要 中 。 

寺 征 2; 句 法 特征 。 句 子 的 主要 结构 就 是 主 谓 宾 
结构 ,不 同 技术 要 素 在 句子 中 充当 的 含义 不 同 。 如 : 产 
品 .材料 和 方法 在 主语 和 宾语 位 置 都 有 可 能 出 现 ,应 用 
领域 和 功效 仅 会 出 现在 宾语 位 置 。 

特征 3: 动词 特征 。 动 词 是 支配 其 他 词性 成 分 的 
中 心 成 分 ,所 有 受 支配 的 成 分 都 以 某 种 依存 关系 从 属 


于 动词 词性 成 分 ”。 不 同 技术 要 素 之 间 的 关联 关系 
可 以 通过 动词 的 含义 来 展现 ,如 :产品 和 材料 之 间 的 组 
成 关系 ,对 应 的 动词 为 “include” 等。 产品 和 应 用 领域 
之 间 的 用 途 关系 ,对 应 的 动词 为 “used for” 等 。 

寺 征 4: 语义 特征 。 虽 然 名 词 的 语义 信息 具有 多 
义 性 ,但 在 特定 技术 领域 中 ,其 语义 相对 稳定 ,减少 了 
语言 理解 的 歧义 。 因 此 ,各 技术 要 素 语义 的 标记 主要 
基于 专利 领域 术语 词典 。 如 :出 现 “fertilizer” 为 中 心 名 
词 的 名 词 短语 为 产品 。 出 现 “material” “peel” “oxide” 
“acid" 等 为 中 心 名 词 的 名 词 短语 为 材料 。 
3.2.2 SAO 结构 与 技术 要 素 关联 分 析 

从 发 明 问题 解决 理论 (TRIZ) 的 观点 来 看 ,SAO 三 
元 组 是 一 种 描述 功能 实现 和 技术 构成 的 模型 。SAO 结 
构 通过 动词 短语 定义 了 两 个 技术 关键 词 之 间 的 关联 关 
系 , 表 示 的 是 “技术 关键 词 - 关联 关系 - 技术 关键 词 ” 
三 元 组 。 技 术 关键 词 之 间 的 关联 关系 有 多 种 ,如 :生物 
医学 领域 的 基因 与 基因 关系 、 蛋 白质 与 蛋白 质 相 互 作 
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po 。 。 人 /三 廿 
以 纳米 肥料 领域 为 例 [J] Gh Ry Me 作 瞻 到 


用 关系 .基因 与 疾病 的 关系 .基因 与 药物 的 关系 ,疾病 
与 治疗 的 关系 等 ”。 微 观 层面 的 技术 要 素 是 技术 关 
键 词 更 抽象 化 的 表示 形式 ,通过 对 SAO 结构 中 的 技术 
关键 词 进行 分 析 , 识别 技术 关键 词 对 应 的 技术 要 素 。 
基于 SAO 结构 的 技术 要 素 表示 模型 如 图 3 所 示 : 
技术 关键 词 关联 关系 技术 关键 词 
国 


A 
名 词 短语 动词 名 词 /形容 词 短 语 


图 3 基于 SAO 结构 的 技术 要 素 表 示 模 型 


3.2.3 基于 SAO 语义 结构 的 特征 识别 
针对 上 述 的 特征 信息 ,选取 合适 的 方法 标记 特征 

信息 ,为 构建 自动 化 的 抽取 方法 挖掘 关键 词 与 技术 要 
素 的 对 应 关系 英 定 基础 。 

QN() 对 于 特征 1, 可 通过 专利 文本 的 标识 信息 识 
中 在 此 不 做 详细 用 述 。 

@ 〇 (2 ) 对 于 特征 2,SAO 结构 是 由 主 谓 宾 结 构 构 建 的 
元 组 ,可 以 直观 展示 出 某 技术 关键 词 是 在 句子 中 的 

分 .因此 ,利用 关键 词 在 SAO 结构 中 的 位 置 ( 即 属 
已 本 还 是 0) 来 判断 其 在 句子 中 的 成 分 。 


CN 
性 


(3) 对 于 特征 3 ,对 SAO 结构 的 动词 (A 部 分 ) 进 
行 分 类 ,构建 专利 动词 语义 框架 来 辅助 SAO 结构 分 
类 。 专 利 动 词 知识 库 的 建立 是 基于 一 定数 量 的 专利 文 
献 训练 集 ,通过 对 动词 进行 词 频 的 统计 ,利用 动词 含义 
对 和 常见 的 动词 进行 分 类 。 该 过 程 可 以 手工 完成 ,也 可 
以 通过 机 器 学 习 辅 助 完成 。 针 对 专利 语义 特点 ,利用 
相关 动词 的 含义 将 SAO 结构 划分 为 :包含 类 (parti- 
tive) 功效 类 (function) 用 途 类 (purpose) 和 相互 作用 
类 (interaction ) 。 

包含 类 是 表示 包含 关系 的 动词 ,所 描述 的 是 主语 和 
宾语 之 间 的 包含 层次 关系 ,如 产品 和 材料 的 包含 关系 ， 
具体 的 动词 有 “contain”“consist”“have” 等 。 功 效 类 是 
表示 属性 变化 的 动词 ,所 描述 的 是 主语 如 何 影 响 宾语 
的 ,这 种 类 型 的 Ao 结构 多 被 构造 成 诸如 “improve effi- 
ciency 等 形式 , 即 提升 类 的 动词 和 表示 效率 、 产 量 等 词 
的 集合 。 用 途 类 是 表示 使 用 关系 的 动词 ,所 描述 的 是 宾 
语 是 主语 的 应 用 领域 ,核心 动词 为 "pe used for” 等 形式 。 
相互 作用 类 主要 是 指 主语 和 宾语 之 间 的 相互 作用 ,如 某 
种 材料 影响 某 种 产品 , 某 种 方法 可 以 用 来 生产 某 种 产 
品 。 本 文 定义 了 各 类 型 的 核心 动词 参考 表 如 表 3 所 示 : 


表 3 关系 类 型 和 核心 动词 


PN 
二 网 而 示例 信息 
关系 类 型 核心 动词 含义 = 
2 技术 要 素 关 键 词 ! 。 ”技术 要 素 关 键 词 2 
> 分 类 comprise, have, include, contain, involve 表示 主语 和 宾语 之 间 的 包含 层次 关系 ”产品 (Water soluble 材料 (modified soybean 
(5 (Sl include S2) fertilizer ) dreg) 
类 improve，increase， reduce， promote degrade，a- 表示 主语 是 如 何 改变 宾语 的 技术 属性 ”产品 ( Water soluble 功效 (improve growth) 
Ra chieve ，realize ，recycle ，accelerate，alleviate，ab- 或 主语 对 宾语 的 影响 (Sl is an objective fertilizer) 
sorb, be easy to, be good for, stabilize for S2) 
人 
祭 类 be used for, (be)used in 表示 宾语 是 主语 的 应 用 领域 (Sl is 产品 (Water soluble 应 用 领域 (leafy vegeta- 
used in S2) fertilizer ) ble) 
相互 作用 类 prepare ，provide ，produce ，obtain，form，develop， ”表示 主语 和 宾语 之 间 的 相互 作用 (Sl 材料 (composite micro- ”材料 ( Aspergillus ni- 
utilize has Interaction with S2 ) bial inoculum ) ger) 


(4) 对 于 特征 4, 主要 通过 线索 词 补充 领域 词 表 ， 
并 利用 WordNet 语义 词典 辅助 同义词 合并 。 虽 然 名 词 
具有 和 多 义 性 ,但 在 特定 技术 领域 中 ,其 语义 相对 稳定 ， 
减少 了 语言 理解 的 攻 义 。 因 此 ,技术 要 素 的 语义 标记 
主要 是 基于 专利 领域 的 术语 词 表 。 识 别 规则 通过 建立 
名 词 短 语 的 词性 标记 规律 和 外 在 边界 词性 标记 规律 来 
识别 。 如 在 纳米 肥料 领域 ,出 现 以 “fertilizer” 为 中 心 名 
词 的 名 词 短语 ,其 技术 要 素 应 标记 为 产品 ;出 现 以 “ma- 
terial”“peel”“oxide”“acid” 等 为 中 心 名 词 的 名 词 短 语 ， 
其 技术 要 素 应 标记 为 材料 。 知 术语 词典 中 包含 的 词 不 
全 , 则 可 进一步 利用 语义 词典 WordNet 查询 其 语义 信 
息 ,标记 特征 词 和 技术 要 素 的 对 应 关系 。 


3.3 ”技术 要 素 识别 框架 

技术 要 素 在 专利 文本 中 的 位 置 、 在 句子 中 充当 的 
成 分 .对 应 的 动词 类 型 以 及 语义 方面 不 同 的 特征 ,可 作 
为 其 判别 的 依据 。 特 征 分 析 阶 段 主要 包括 基于 标题 和 
摘要 的 语义 特征 信息 标记 ,以 专利 标题 和 摘要 的 文本 
言 息 作为 数据 源 进行 语义 标记 的 过 程 主要 是 实现 从 专 
利 的 语义 信息 中 挖掘 技术 要 素 的 特征 。 基 于 领域 数据 
进行 技术 要 素 识 别 前 ,必须 对 专利 文献 进行 预 处 理 , 包 
括 :检索 、 下 载 和 格式 转换 等 ,将 专利 文献 中 的 各 部 分 
分 段 存储 ,形成 具有 统一 数据 格式 的 领域 专利 数据 集 。 
基于 SAO 语义 结构 的 技术 要 素 识别 方法 通过 
SAO 结构 集 来 识别 技术 要 素 的 特征 信息 。 通 过 位 置 特 
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征 、 句 法 特征 和 动词 特征 可 以 实现 功效 和 应 用 领域 技 
术 要 素 的 识别 。 对 于 产品 、 材 料 和 方法 技术 要 素 ,需要 
进一步 通过 语义 特征 来 识别 。 在 此 过 程 中 ,由 于 从 典 
型 专利 剖析 所 利用 的 小 数据 量 的 专利 文献 集合 到 特定 
领域 大 数据 量 的 专利 文献 集合 ,会 存在 部 分 技术 词 没 
有 对 应 的 技术 要 素 。 出 现 此 问题 的 原因 有 两 种 :中 由 


_ 汗 领域 专利 
数据 集 


DI 数据 库 检索 式 


NLP 技术 Tl 


于 专利 动词 知识 库 和 领域 词典 中 线索 词 不 全 导致 部 分 
技术 词 和 技术 要 素 未 产生 关联 ,需要 人 工 总 结 其 特征 
并 补充 相关 知识 库 的 信息 ; 包 由 于 出 现 了 在 抽样 数据 
中 未 包含 的 技术 要 素 ,需要 总 结 其 特征 信息 ,完善 技术 
要 素 识别 框架 。 基 于 特征 的 技术 要 素 识 别 框 架 如 图 4 
所 示 : 


特征 1 
位 置 特征 


Fr----------------------------------。 


了 
~ 

GN 

© 

CD 

© 

-0 

< 十 

© 

CD 

4O 案 例 研 究 
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未 文 以 纳米 肥料 领域 的 专利 数据 作为 数据 源 , 展 
示 牧 术 要 素 的 识别 结果 。 纳 米 肥料 是 纳米 技术 在 农业 
同治 一 个 里 程 碑 式 的 应 用 , 它 是 用 纳米 材料 技术 构建 、 
用 有 医药 短 胶 忆 技 术 和 化 工 微 乳化 技术 改 性 及 化 学 于 全 

成 的 全 新 肥料 ,包括 纳米 结构 肥料 与 纳米 材料 包 
膜 成 胶结 组 . 控 释 肥料 ” 。 本 文 以 纳米 肥料 领域 相关 
专利 为 研究 对 象 , 检 索 日 期 为 2018 年 11 月 27 日 。 基 
于 DI 专利 数据 库 检索 获取 了 779 件 专利 ,以 2018 年 


特征 3 技术 要 素 | 
动词 特征 功效 应 用 领域 | | 
i 
3 技术 要 素 | 

产品 材料 


的 近 : 


图 4 基于 特征 的 技术 要 素 识 别 框架 


的 46 件 专利 作为 分 析 对 象 ,完成 案例 分 析 部 分 。 
4.1 纳米 肥料 领域 典型 专利 剖析 

选取 了 纳米 肥料 领域 10 件 专利 作为 典型 专利 进 
行 剖 析 ,提取 领域 关键 词 ,人 工 总 结 关 键 词 的 含义 ,分 
为 五 大 类 。 该 领域 涉及 的 技术 要 素 有 :产品 .材料 \ 方 
法 ,功效 和 应 用 领域 。 对 技术 要 素 对 应 的 领域 关键 词 
的 相关 特征 进行 了 人 工 标 注 ,标注 的 特征 包括 :技术 要 
素 的 位 置 特征 \ 句 法 特征 、 动 词 特征 及 语义 特征 。 具 体 
剖析 的 形式 如 表 4 所 示 : 


表 4 “纳米 肥料 ”专利 技术 要 素 特征 剖析 示例 


专利 号 CN108530210-A 


内 容 TI: Water-soluble fertilizer comprises modified soybean dregs, egg shell, plant ash, banana peel, apple peel pear peel, nano cerium oxide, lutetium oxide, nano 


selenium, 5-aminolevulinic acid and bentonite. 


USE - The water-soluble fertilizer is useful for planting corn 


技术 要 素 位 置 特征 句法 特征 动词 特征 语义 特征 
产品 (Water-soluble fertilizer ) TI USE 主语 is useful for .comprises 名 词性 短语 ,线索 词 为 fertilizer 
材料 (modified soybean dregs…) TI 宾语 comprises 名 词性 短语 ,线索 词 为 dregs ,shell ,oxide 等 
应 用 领域 (planting corn) USE 宾语 is useful for 线索 词 为 planting 


4.2 基于 SAO 语义 结构 的 特征 识别 
4.2.1 SAO 结构 抽取 

文本 首先 利用 自然 语言 处 理 技术 (NLP) 提取 专利 
文本 中 的 SAO 结构 。 利 用 CluseIE 借助 Java 开发 环境 
抽取 标题 和 摘要 部 分 的 SAO 结构 ,利用 DDA 软件 对 原 


始 SAO 结构 进行 清洗 ,去 除 与 领域 无 关 的 结构 ,得 到 
待 分 析 的 SAO 结构 857 个 。 
4.2.2 SAO 结构 位 置 标 记 

对 于 从 文本 中 提取 出 的 SAO 结构 ,将 对 应 的 位 置 
言 息 以 及 专利 号 存储 在 excel 中 ,以 进行 下 一 步 的 分 
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以 纳米 肥料 领域 为 例 [J]] 6 hina NY 合作 期 噶 


析 。 具 体 信 息 如 表 5 所 示 : 


表 5 2018 年 纳米 肥料 专利 文本 抽取 的 SAO 结构 示例 ( 部分) 


专利 号 S A 0 位 置 
CN108314556 A Selenium rich agricultural fertilizer comprises carboxylase TI 
CN108314556 A Selenium rich agricultural fertilizer comprises wood vinegar TI 
CN108314556 A Selenium rich agricultural fertilizer comprises mixed bacterial liquid TI 
CN108314556 A Selenium rich agricultural fertilizer comprises nano selenium powder TI 
CN108314556 A Selenium rich agricultural fertilizer comprises soy protein powder TI 
CN108314556 A Selenium rich agricultural fertilizer comprises Bacillus megaterium TI 
CN108358700 A Selenium enriched pitaya organic fertilizer includes nanoselenium plant nutrient agent TI 
CN108358700 A Selenium enriched pitaya organic fertilizer includes straw ash TI 
CN108358700 A Selenium enriched pitaya organic fertilizer includes urea TI 
CN108358700 A Selenium enriched pitaya organic fertilizer includes animal feces TI 


4.2.3 ”基于 动词 语义 框架 的 SAO 结构 分 类 
本 将 SAO 结构 中 的 核心 动词 与 构建 的 动词 知识 库 
动词 进行 匹配 ,完成 了 676 个 SAO 结构 的 分 类 。 
SED) 结 构 语 料 中 的 核心 动词 TOP10 部 分 信息 如 表 6 
MR. 对 于 剩余 的 SAO 结构 ,利用 专家 知识 将 核心 动 
词 刘 分 到 具体 的 类 别 中 ,并 将 动词 信息 补充 到 动词 知 
调 府 中 。 通 过 此 部 分 研究 ,SAO 结构 可 分 为 564 个 包 
3 .197 个 功效 类 36 个 用 途 类 和 60 个 相互 作用 类 。 
2018 年 纳米 肥料 专利 文本 核心 动词 TOP10 ( 部 分 ) 


230 


动词 词 频 所 属 类 别 词 

ON comprise 402 包含 类 
> have 47 包含 类 
S< improve 46 功效 类 
CB used for 39 用 途 类 
6 ik 38 包含 类 
‘© om 26 包含 类 
加 inolhe 25 包含 类 
is 25 功效 类 

is useful for 21 用 途 类 
prepared by 15 相互 作用 > 


4.3 ”面向 纳米 肥料 领域 的 技术 要 素 识别 框架 

对 于 标题 和 新 颖 性 部 分 的 SAO 结构 ,包含 类 SAO 
结构 对 应 的 S 或 0 是 产品 ,材料 和 方法 技术 要 素 ,表示 
单一 维度 或 多 维度 的 技术 要 素 层次 关系 ;对 于 创新 性 
摘要 部 分 的 SAO 结构 ,包含 类 SAO 结构 对 应 的 S 部 分 
是 产品 或 方法 技术 要 素 ,0 部 分 为 功效 技术 要 素 ; 对 于 
功效 类 SAO 结构 ,其 对 应 的 S 短语 类 型 是 产品 .材料 
和 方法 技术 要 素 ,0 短语 类 型 为 功效 技术 要 素 ; 对 于 用 
途 类 SAO 结构 ,其 对 应 的 $ 短语 类 型 是 产品 .材料 和 
方法 技术 要 素 ,0 短语 类 型 为 应 用 领域 技术 要 素 ; 对 于 
相互 作用 类 SAO 结构 ,表示 不 同 技 术 要 素 之 间 的 关联 
关系 ,如 方法 与 产品 之 间 的 相互 作用 、 方 法 与 材料 之 间 


的 相关 作用 等 。 因 此 ,对 于 产品 材料 和 方法 技术 要 素 
的 识别 ,仅仅 通过 SAO 结构 的 位 置 和 类 型 信息 无 法 全 
部 确定 ,需要 判断 是 否 包 含 产品 ` 材 料 和 方法 技术 要 素 
对 应 的 线索 词 来 建立 与 技术 要 素 的 对 应 关系 。 图 5 表 
示 了 纳米 肥料 领域 技术 要 素 识 别 框 架 。 表 7 展示 了 各 
技术 要 素 对 应 的 特征 值 信 息 。 


蛋 询 其 对 应 


SAO 结构 


上 获取 特征 值 
获取 特征 值 
| 


领域 词 表 匹配 值 


F 特 征 值 的 技术 要 素 识别 


纳米 肥料 领域 技术 要 素 识别 框架 


| 


图 5 


表 7 基于 位 置 和 分 类 信息 的 技术 要 素 特 征 值 信息 


关系 类 型 标题 新 颖 性 摘 j 途 摘要 创新 性 摘要 

包含 类 S:PMM S:PMM 无 S:PMM 
O:PMM O:PMM AOZ0 :功效 

功效 类 S:PMM 无 无 S:PMM 
AOZ0 :功效 AOZ0 :功效 

j 途 类 S:PMM 无 S:PMM 无 
0 :用途 0: 用 途 
相互 作用 类 5S:PMM S:PMM S:PMM S:PMM 
O:PMM 0:PMM 0:PMM O:PMM 


注 :PMM 指 的 是 产品 .材料 和 方法 技术 要 素 
4.4 技术 要 素 识别 结果 
4.4.1 评价 方法 
本 研究 采用 准确 率 和 召回 率 作 为 指标 对 实验 结果 
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进行 评价 ,公式 如 下 : 


Precision = A 
| 
Recall = 2 


其 中 ,Precision 表示 准确 率 ,Recall 表示 召回 率 ,A 表 
示 实 验方 法 识别 出 的 结果 个 数 ,HH 表示 基准 数据 集合 中 的 
结果 个 数 。 本 研究 借助 具有 专业 背景 的 人 员 对 技术 关键 
词 对 应 的 技术 要 素 进行 标注 ,作为 基准 数据 集合 。 
4.4.2 识别 结果 分 析 

基于 技术 要 素 识别 框架 ,首先 通过 SAO 结构 位 置 
和 分 类 信息 共识 别 出 172 个 功效 关键 词 和 15 个 用 途 
关联 词 。 通 过 纳米 肥料 领域 词 表 以 及 线索 词 ,确定 其 
佘 的 关键 词 对 应 的 技术 要 素 。 通 过 此 步 识别 ,得 到 50 
个 产品 关键 词 341 个 材料 关键 词 和 26 个 方法 关键 词 。 
通过 专家 知识 进一步 对 纳米 肥料 领域 涉及 的 技术 要 素 
进 稳 适 用 性 分 析 , 验 证 了 识别 效果 的 准确 性 。 首 先 ,对 
了 9 起 术 要 素 的 划分 ,认为 纳米 肥料 领域 划分 为 5 种 要 
素 是 合理 的 ,但 是 由 于 纳米 肥料 的 主要 技术 是 针对 各 
林 简 含量 的 不 同 而 实现 的 ,后 期 可 否 增加 材料 含量 相 


关 卫 信息 ;对 于 技术 关键 词 和 技术 要 素 的 对 应 关系 , 目 
前 的 识别 结果 是 合理 的 。SAO 结构 的 位 置 .分 类 信息 
组 污 情 况 如 表 8 所 示 ,技术 关键 词 与 技术 要 素 的 对 应 
关 索 如 表 9 所 示 : 

< ” 表 8 SAO 结构 位 置 和 分 类 信息 统计 


类 型 标题 新 颖 性 摘要 用 途 摘要 创新 性 摘要 
: 己 旬 含 类 289 225 0 50 
EE 
= 功效 类 15 0 7 182 
用 途 类 12 0 17 0 
相互 作用 类 30 15 8 7 


表 9 技术 关键 词 与 技术 要 素 的 对 应 关系 


技术 关键 词 技术 要 素 
organicic fertilizer, bio organicic fertilizer, complex fertilizer, environ- 产品 
mental friendly fertilizer, foliar fertilizer, nitro fertilizer, selenium ger- 
manium enriched element fertilizer, silicon fertilizer, synergbetic fertil- 
izer, water soluble fertilizer，… 
urea, plant ash, chitin, nano carbon, additive, bentonite, composite , 材料 
copper sulfate, ferrous sulfate, humic acid ，… 
method, produce organicic fertilizer, mix pig manure, prepare microele- 方法 
ment nanochelate foliar fertilizer composite, achieve modified gas pres- 
sure, add calcium fertilizer, add magnesium fertilizer, add nano actingi- 
vated carbon, add phosphoricic acid, add potassium mitrate ，…， 
yield, quality, low cost, utilization rate, environmental friendly, syn- 功效 


ergbetic effect, growth, soil, efficiency, rich nutrient ，safe ，… 


aquaculture ，Camellia oleifera，corn，cucumber，deodorizing fecal 应 用 领域 
waste, fermentation fecal waste, flower, fruit tree pestss, grape, in- 


sect resbetance ，…: 


4.4.3 识别 效果 评估 

技术 要 素 识 别 结果 评估 如 表 10 所 示 ,经 对 比 发 现 
产品 技术 要 素 和 材料 技术 要 素 识别 效果 较 好 ,应 用 领 
域 技 术 要 素 和 功效 技术 要 素 次 之 ,方法 技术 要 素 较 差 。 
一 方面 原因 在 于 产品 和 材料 技术 要 素 多 为 名 词 或 名 词 
短语 ,线索 词 较为 明显 ,因此 识别 效果 较 好 ; 另 一 方面 ， 
方法 技术 要 素 对 应 的 关键 词 多 为 名 词 或 名 词 短语 以 及 
动 名 词 与 名 词 短语 的 组 合 。 方 法 技术 要 素 特 征 词 集 有 
待 进一步 完善 ,由 于 北 选 具有 显著 方法 类 型 特征 的 短 
语 较为 困难 ,对 于 方法 技术 要 素 的 识别 效果 尚 不 完善 。 
表 10 技术 要 素 识别 结果 评估 


出 


基准 数据 人 工 标注 结果 
技术 要 素 准确 率 召回 率 
品 86% 95.35% 
材料 91.79% 98.43% 
方法 100% 53.06% 
应 用 领域 77.78% 93.33% 
功效 91.86% 96.93% 

5 结论 


为 满足 细 粒 度 技 术 演 化 分 析 的 需求 ,本 文 以 专利 
文献 为 分 析 对 象 ,通过 典型 专利 剖析 初步 确定 领域 技 
术 要 素 及 其 特征 ,然后 从 位 置 .句法 ` 动 词 和 语义 特征 
入 手 , 设 计 了 特征 识别 方法 来 自动 识别 技术 要 素 的 特 
征 。 基 于 此 ,本 文 构建 了 基于 特征 的 技术 要 素 识 别 杠 
架 , 以 纳米 肥料 领域 为 研究 对 象 ,应 用 技术 要 素 识 别 杠 
架 完 成 了 技术 要 素 的 识别 ,并 对 识别 结果 进行 分 析 与 
评价 ,展示 了 技术 要 素 识别 方法 的 可 行 性 和 有 效 性 。 

本 文 提出 的 技术 要 素 识 别 方法 可 以 根据 技术 领域 
的 特征 构建 不 同 的 技术 分 析 维度 ,基于 特征 识别 技术 
要 素 以 及 技术 要 素 之 间 的 关联 关系 ,可 以 从 多 角度 、 多 
层面 展示 专利 的 技术 信息 ,方法 具有 灵活 性 和 系统 性 。 
然而 ,本 文 仍 存在 以 下 不 足 之 处 : 

(1) 由 于 篇 幅 有 限 , 本文 仅 对 纳米 肥料 领域 2018 
年 的 专利 进行 了 深入 分 析 , 后 期 可 以 研究 纳米 技术 在 
农业 领域 的 应 用 中 涉及 到 的 所 有 产品 领域 ,例如 纳米 
疫苗 、 纳 米 兽 药 等 。 

(2) 基 于 SAO 结构 完全 自动 化 地 识别 技术 要 素 还 
不 够 精确 ,各 技术 要 素 线 索 词 避 选 需要 借助 大 量 的 领 
域 数据 。 后 续 研 究 需 要 提升 技术 要 素 识 别 的 自动 化 程 
度 及 准确 性 ,进一步 减少 对 专家 知识 的 依赖 性 。 

技术 发 展 的 日 新 月 异 ,交叉 融合 是 必然 趋势 。 由 
此 , 细 粒 度 分 析 已 逐渐 成 为 技术 演化 领域 的 研究 重点 。 
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ER 上 
以 纳米 肥料 领域 为 例 [J] 4 由 人 全 吉 到 


只 别 个 体 技术 要 素 当 前 所 处 研究 阶段 及 其 在 不 同 阶段 
间 转 移 扩散 的 时 间 线 索 和 技术 细节 差异 ,能够 有 效 文 
撑 开 展 个 体 技术 成 熟 度 以 及 转移 过 程 差异 性 分 析 等 细 
粒度 技术 情报 分 析 工 作 ,为 技术 演化 分 析 呐 定数 据 基 
础 。 另 外 ,在 方法 的 应 用 上 ,后续 研 究 需要 探索 如 何 真 

正 利用 技术 要 素 构 建 技术 演化 所 需 的 技术 网 络 , 如 何 
将 技术 演化 路 径 与 TRIZ 技术 进化 路 径 结 合 进 行 技术 


预测 ,达到 发 现 潜在 研究 机 会 .辅助 技术 研发 选 题 等 情 
报 工作 目标 。 
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Abstiract: | Purpose/ significance | Patent is one of the most reliable sources of technical intelligence. By patent 
alysis , One can realize the mining and the utilization of patent information, and the technology innovation. Techno- 
Solical evolution analysis refers to the process of emergence, development, transfer, change and even annihilation of 
(Khnology themes. The focus of the current research is to deeply reveal the patent technology information, technical 
ments are the key to deeply reveal patent technology information. | Method/process | Proposing a method for i- 
tifying technical elements based on patent documents for specific fields by analyzing typical patents and feature 
recognition. | Result/conclusion | Applying our methods to the nano fertilizer field, through the analysis of typical 
patents, five technical elements are identified : materials, products, methods, functions and usage, and the identifi- 
cation of technical elements is completed based on SAO structure and domain vocabulary. Our methods can serve as 
a foundation for technological evolution analysis, and display field technical information from multiple perspectives. 
Keywords: technological evolution technological elements SAO structure nano fertilizer technological net- 


work 


68 


